我们建议使用以光源方向为条件的神经辐射场(NERF)的扩展来解决多视光度立体声问题。我们神经表示的几何部分预测表面正常方向,使我们能够理解局部表面反射率。我们的神经表示的外观部分被分解为神经双向反射率函数(BRDF),作为拟合过程的一部分学习,阴影预测网络(以光源方向为条件),使我们能够对明显的BRDF进行建模。基于物理图像形成模型的诱导偏差的学到的组件平衡使我们能够远离训练期间观察到的光源和查看器方向。我们证明了我们在多视光学立体基准基准上的方法,并表明可以通过NERF的神经密度表示可以获得竞争性能。
translated by 谷歌翻译
Explainable Artificial Intelligence (AI) in the form of an interpretable and semiautomatic approach to stage grading ocular pathologies such as Diabetic retinopathy, Hypertensive retinopathy, and other retinopathies on the backdrop of major systemic diseases. The experimental study aims to evaluate an explainable staged grading process without using deep Convolutional Neural Networks (CNNs) directly. Many current CNN-based deep neural networks used for diagnosing retinal disorders might have appreciable performance but fail to pinpoint the basis driving their decisions. To improve these decisions' transparency, we have proposed a clinician-in-the-loop assisted intelligent workflow that performs a retinal vascular assessment on the fundus images to derive quantifiable and descriptive parameters. The retinal vessel parameters meta-data serve as hyper-parameters for better interpretation and explainability of decisions. The semiautomatic methodology aims to have a federated approach to AI in healthcare applications with more inputs and interpretations from clinicians. The baseline process involved in the machine learning pipeline through image processing techniques for optic disc detection, vessel segmentation, and arteriole/venule identification.
translated by 谷歌翻译
我们提出了Composuite,这是一种用于组成多任务增强学习(RL)的开源模拟机器人操纵基准。每个复合仪任务都需要特定的机器人组来操纵一个单独的对象,以实现一个任务目标,同时避免障碍物。该任务的这种组成定义赋予了Composuite具有两个非凡的属性。首先,改变机器人/对象/客观/障碍元素会导致数百个RL任务,每个任务都需要有意义的不同行为。其次,可以专门评估RL方法,以了解其学习任务的组成结构的能力。后者在功能上分解问题的能力将使智能代理能够识别和利用学习任务之间的共同点,以处理大量高度多样化的问题。我们在各种培训环境中基准了现有的单任务,多任务和组成学习算法,并评估其在构图上概括到看不见的任务的能力。我们的评估暴露了现有RL方法在组成方面的缺点,并为调查开辟了新的途径。
translated by 谷歌翻译
尽管深度神经网络(DNNS)在封闭世界的学习方案中取得了令人印象深刻的分类性能,但它们通常无法概括地在动态的开放世界环境中看不见的类别,在这种环境中,概念数量无界的数量。相反,人类和动物学习者具有通过识别和适应新颖观察结果来逐步更新知识的能力。特别是,人类通过独家(唯一)基本特征集来表征概念,这些特征既用于识别已知类别和识别新颖性。受到自然学习者的启发,我们引入了稀疏的高级独特,低水平共享的特征表示(Shels),同时鼓励学习独家的高级功能和必不可少的,共享的低级功能。高级功能的排他性使DNN能够自动检测到分布(OOD)数据,而通过稀疏的低级功能可以有效利用容量,可以容纳新知识。最终的方法使用OOD检测来执行班级持续学习,而没有已知的类边界。我们表明,使用木材进行新颖性检测导致对各种基准数据集的最新OOD检测方法的统计显着改善。此外,我们证明了木木模型在课堂学习环境中减轻灾难性的遗忘,从而实现了一个组合的新颖性检测和住宿框架,该框架支持在开放世界中学习
translated by 谷歌翻译
我们展示了如何relight一种场景,描绘在单个图像中,使得(a)整体着色已经改变,并且(b)得到的图像看起来像该场景的自然图像。此类过程的应用包括生成培训数据和构建创作环境。这样做的天真方法失败了。一个原因是阴影和反照学相当强烈相关;例如,阴影中的尖锐边界倾向于出现在深度不连续性,通常在Albedo中显而易见。相同的场景可以以不同的方式点亮,并且建立的理论表明了不同的灯具形成锥形(照明锥)。新颖的理论表明,人们可以使用类似的场景来估计适用于给定场景的不同照明,其中有界预期的误差。我们的方法利用该理论来估计照明锥的抵抗发生器形式的可用照明场的表示。我们的程序不需要昂贵的“逆图形”数据集,并且没有任何类型的地面真理数据。定性评估表明该方法可以擦除和恢复柔软的室内阴影,并可以在场景周围“转向”光。我们提供了对FID的新应用方法的总结定量评估。 FID的扩展允许每个生成的图像评估。此外,我们提供了与用户学习的定性评估,并显示我们的方法产生可以成功用于数据增强的图像。
translated by 谷歌翻译
自从20020年9月在世界上越来越多的Covid-19,截至世界上的确认病例和死亡人数最多,该国大多数国家都强制了行动限制,导致流动性急剧减少。然而,这场危机的整体影响和长期影响旅行和流动仍然不确定。为此,本研究开发了一个分析框架,决定和分析了影响人类流动性和在美国的最主要的因素。特别是,该研究使用GRANGER因果关系来确定影响日常车辆数英里的重要预测因子,并利用包括脊和套索技术的线性正则化算法,以模拟和预测移动性。状态级时间序列数据是从从3月1日开始的各种开放式访问来源获得,从3月1日至6月13日,2020年6月13日,整个数据集被分成两部分以进行训练和测试。 Granger因果关系选择的变量用于通过普通的最小二乘回归,脊回归和套索回归算法培训三种不同的减少订单模型。最后,在测试数据上检查了开发模型的预测准确性。结果表明,包括新的Covid案件,社会疏散指数,人口的人口,居住在家里的人口,占外的百分比,不同的目的地,社会经济地位,在家中工作的人的百分比,以及州所有人关闭其他人是影响每日VMT的最重要因素。此外,在所有建模技术中,RIDGE回归提供了最常见错误的最优越的性能,而套索回归也比普通最小二乘模型更好。
translated by 谷歌翻译